4.2 RRN
MN-Core 2はMV命令(第3.5節)、L2BM命令(第3.6.7節)、L1BM命令(第3.6.8節)の 3 箇所で縮約
命令を実行できる。
L1BM命令には 4 要素の縮約が行われる4x4縮約と、 16 要素の縮約が行われる16x1縮約の 2 種類の縮約
が存在する。 16 要素縮約は 4 要素縮約を 2 回行うことで実現されている。浮動小数点数加算(fadd)と、浮動
小数点数最大値および最小値(max/min)で扱いが異なるのでそれぞれ解説する。
第3.6.8.5節で述べたとおり、L1BM命令の半精度浮動小数点数縮約は単精度浮動小数点数縮約を用いて実
装されている。そのため、L1BM命令の浮動小数点数縮約は実質的には単精度と倍精度しか存在しない。ま
た、精度縮減は単精度浮動小数点数演算にしか適用できないことに注意する。
MV命令とL2BM命令にはL1BM命令と異なり半精度・単精度・倍精度の浮動小数点数演算回路がある。
L2BM命令では小さい要素数の縮約回路を多段で用いて大きい要素数の縮約を行うことはしない。MV命令
では、グループ内縮約のための 2 要素縮約と、グループ間縮約のための 4 要素縮約の回路がそれぞれ存在す
る。L2BM→DRAMグループ間縮約命令(第3.5.8.21節)およびL2BM→PDMグループ間縮約命令(第
3.5.8.19節)では、これらを用いて 2 回縮約を行うことで 8 要素の縮約を実現している。
4.2.1 RRN浮動小数点数加算
4.2.2 RRN浮動小数点数最大値および最小値